今天是第三天,要來介紹的是卷積神經網絡(CNN),這是一種廣泛應用在圖像處理的學習模型。它的設計靈感來自人類的視覺系統,可以有效地辨認圖像中的特徵然後進行分類。
CNN的主要組成部分包括卷積層、池化層和激活函數等。接下來,我會分成幾天來介紹這幾個是怎麼運作的~
1.卷積層(Convolutional Layer)
卷積層是CNN的核心。它通過一種叫做「卷積操作」的方法來得到輸入圖像中的局部特徵。卷積操作的過程可以簡單想成使用一個小矩陣,也就是所謂的「卷積核(Kernel)」,在圖像上滑動。
這個卷積核每次覆蓋圖像的一小塊區域,進行點積運算,就可以產生一個新的值。當整個圖像經過這個滑動運算後,就會形成一個「特徵圖(Feature Map)」。
卷積核的大小一般來說是3x3或 5x5的矩陣。
卷積核的參數(也就是權重)在訓練過程中不斷調整,用來適應不同的特徵,因此可以捕捉圖像中的紋理、邊緣、角點等重要的信息。
透過調整「步長(Stride)」和「填充(Padding)」,可以控制特徵圖的尺寸,使得網絡適應不同的輸入圖像。
明天要介紹的是激活函數!敬請期待!